Scholar Hub/Chủ đề/#học máy nâng cao/
Học máy nâng cao, thuộc lĩnh vực trí tuệ nhân tạo, nghiên cứu hệ thống cải thiện từ dữ liệu, sử dụng kỹ thuật phức tạp cho bài toán khó. Các thuật toán nổi bật gồm học sâu, mạng nơ-ron tích chập, học tăng cường. Ứng dụng rộng rãi trong y tế, tài chính, giao thông, giúp chẩn đoán bệnh, phát hiện gian lận, phát triển xe tự hành. Dù đối mặt thách thức về dữ liệu lớn và đạo đức, sự phát triển không ngừng của công nghệ hứa hẹn mang lại đột phá, cần sự hợp tác giữa các chuyên gia để tối đa hoá tiềm năng.
Giới Thiệu Về Học Máy Nâng Cao
Học máy nâng cao là một lĩnh vực của trí tuệ nhân tạo (AI) tập trung vào việc xây dựng và nghiên cứu các hệ thống có khả năng học tập và cải thiện hiệu suất từ dữ liệu. Khác với học máy cơ bản, học máy nâng cao tích hợp những kỹ thuật và phương pháp phức tạp hơn để xử lý lượng dữ liệu lớn và giải quyết các bài toán khó trong thực tế.
Các Thuật Toán và Phương Pháp Học Máy Nâng Cao
Trong học máy nâng cao, nhiều thuật toán và phương pháp mới được phát triển và sử dụng, bao gồm:
- Học Sâu (Deep Learning): Sử dụng mạng nơ-ron nhân tạo với nhiều lớp, cho phép máy tính học tập từ dữ liệu đa dạng và phức tạp hơn. Đây là nền tảng của các ứng dụng như nhận diện hình ảnh, xử lý ngôn ngữ tự nhiên và phân tích video.
- Mạng Nơ-ron Tích Chập (Convolutional Neural Networks - CNNs): Thường được sử dụng trong xử lý ảnh và video, CNNs giúp tự động trích xuất các đặc điểm từ hình ảnh và hỗ trợ nhận diện hình học hiệu quả.
- Mạng Nơ-ron Tái Phát (Recurrent Neural Networks - RNNs): Phù hợp với dữ liệu tuần tự, RNNs thường được áp dụng trong xử lý ngôn ngữ và chuỗi dữ liệu thời gian như phân tích âm thanh hoặc chuỗi ký tự.
- Học Tăng Cường (Reinforcement Learning): Tập trung vào việc huấn luyện các tác nhân (agent) thông qua tương tác với môi trường để tối ưu hóa một chiến lược hoặc hành động nhằm đạt được phần thưởng tối đa.
Các Ứng Dụng Thực Tiễn
Ứng dụng của học máy nâng cao lan rộng trong nhiều lĩnh vực khác nhau, chẳng hạn như:
- Y Tế: Phân tích dữ liệu y tế để chẩn đoán bệnh, cá nhân hóa điều trị và dự báo xu hướng sức khỏe cộng đồng.
- Tài Chính: Phát hiện gian lận, phân tích rủi ro đầu tư và giao dịch tự động.
- Giao Thông: Phát triển xe tự hành, quản lý lưu thông thông minh và tối ưu hóa chuỗi cung ứng.
Thách Thức và Tương Lai
Học máy nâng cao đối mặt với nhiều thách thức như xử lý dữ liệu lớn, yêu cầu tính toán cao và vấn đề đạo đức trong việc sử dụng dữ liệu. Tuy nhiên, với sự tiến bộ không ngừng của công nghệ, học máy nâng cao hứa hẹn mang đến những đột phá quan trọng trong tương lai, góp phần thúc đẩy sự phát triển bền vững và cải thiện chất lượng cuộc sống.
Việc nghiên cứu và ứng dụng học máy nâng cao cần sự hợp tác giữa các nhà khoa học dữ liệu, kỹ sư phần mềm và các chuyên gia trong những lĩnh vực liên quan. Sự hợp tác này sẽ giúp tận dụng tối đa tiềm năng của học máy nâng cao, mở ra những khả năng mới cho thế giới tương lai.
Phân tích hóa học và sinh học về hormone gây rối loạn nội tiết và hoạt tính estrogen trong một nhà máy xử lý nước thải nâng cao Dịch bởi AI Environmental Toxicology and Chemistry - Tập 27 Số 8 - Trang 1649-1658 - 2008
Tóm tắtCác hormone steroid estrone (E1), 17β‐estradiol (E2), estriol (E3), 17α‐ethinylestradiol (EE2), và các dạng liên hợp của chúng đã được khảo sát trong một nhà máy xử lý nước thải nâng cao (STP). Nồng độ estrogen trong mẫu nước và bùn, được thu thập vào tháng 10 năm 2004 và tháng 4 năm 2005, đã được xác định bằng phương pháp sắc ký khí-spectrometric khối lượng và sắc ký lỏng-spectrometric khối lượng giai đoạn tandem. Đồng thời, hoạt tính estrogen được định lượng bằng cách sử dụng các dòng tế bào đáp ứng estrogen (MELN) để điều tra hành vi của tổng thể các hợp chất estrogen. Nồng độ estrogen tại đầu vào dao động từ 200 đến 500 ng/L, với tỷ lệ các dạng liên hợp chiếm hơn 50%. Các estrogen chính trong nước thải đầu vào là E1 và E3. Hoạt tính estrogen dao động trong khoảng từ 25 đến 130 ng/L tương đương E2 (EEQs). Nồng độ estrogen và hoạt tính estrogen đo được ở đầu vào và trong nước thải đã qua xử lý sơ bộ tương tự nhau, cho thấy tác động yếu của quá trình xử lý sơ bộ đối với việc loại bỏ hormone. Ngược lại, cả nồng độ estrogen và hoạt tính estrogen đều giảm trong quá trình xử lý sinh học, với hiệu suất loại bỏ cao (>90%). Estrone, E2, và EE2 tồn tại trong nước đã xử lý dưới 10 ng/L, trong khi hoạt tính estrogen thấp hơn 5 ng/L EEQs. Lưu lượng khối lượng estrogen trong nước thải ra và bùn đại diện cho dưới 2% và 4%, tương ứng, của đầu vào. Do đó, phần của estrogen được hấp phụ vào bùn là rất nhỏ, và sự phân hủy sinh học là phương thức chính để loại bỏ estrogen. Cách tiếp cận kết hợp này, so sánh phân tích hóa học và sinh học, cho phép chúng tôi xác nhận rằng hầu hết hoạt tính estrogen xảy ra trong STP này, chủ yếu nhận nước thải sinh hoạt, là do hormone giới.
Phân loại đất nâng cao bằng học máy thông qua việc tích hợp dữ liệu lỗ khoan và thử nghiệm thâm nhập CPTU với việc lọc tiếng ồn Dịch bởi AI Bulletin of Engineering Geology and the Environment - Tập 80 - Trang 9157-9171 - 2021
Việc tích hợp dữ liệu lỗ khoan và thử nghiệm thâm nhập piezocone (CPTU) trong việc xác định đặc điểm địa điểm giúp đạt được hiểu biết toàn diện hơn về điều kiện mặt đất. Tuy nhiên, các loại đất tại các địa điểm CPTU và lỗ khoan gần đó có thể không luôn nhất quán. Sự hiện diện của dữ liệu nhiễu hoặc các lớp đất mỏng sẽ làm sai lệch việc diễn giải dữ liệu CPTU trong phân loại loại đất và đánh giá các thuộc tính đất. Nghiên cứu này đề xuất một phương pháp học máy kết hợp để tích hợp dữ liệu lỗ khoan và CPTU dưới một khuôn khổ Bayes nghiêm ngặt và để xác định, phân tách dữ liệu CPTU nhiễu mà không cần phán xét chủ quan, điều này góp phần vào việc phân loại đất và đánh giá thuộc tính đất đáng tin cậy hơn. Loại đất được báo cáo từ lỗ khoan và dữ liệu CPTU được coi là hai loại bằng chứng cho loại đất thực sự. Một sự chuyển tiếp bên của loại đất từ vị trí CPTU đến vị trí lỗ khoan được cho phép để nắm bắt sự khác biệt về loại đất. Phương pháp đề xuất được áp dụng trong việc xác định đặc điểm địa điểm biển của cầu Hồng Kông - Chu Hải - Ma Cao bắc qua cửa sông Châu Giang của Trung Quốc. Các lớp đất được nhúng trong các tầng đất chính đã được phát hiện thành công, tạo ra một hồ sơ đất đáng tin cậy hơn và diễn giải các thuộc tính đất tương thích hơn với thực tiễn kỹ thuật. Thêm vào đó, việc tích hợp dữ liệu lỗ khoan và CPTU giảm thiểu đáng kể sự không chắc chắn về lớp địa tầng trong việc xác định đặc điểm địa điểm.
#Phân loại đất #Dữ liệu lỗ khoan #Thử nghiệm thâm nhập CPTU #Học máy #Lọc tiếng ồn #Đặc điểm địa điểm
ÁP DỤNG HỌC MÁY ĐỂ NÂNG CAO ĐỘ CHÍNH XÁC CHO DỰ ĐOÁN NGUY CƠ ĐA DI TRUYỀN VỚI DỮ LIỆU RỐI LOẠN PHỔ TỰ KỶĐiểm nguy cơ đa di truyền (polygenic risk scores, PRS) là một giá trị ước lượng tương đối nguy cơ mắc bệnh dựa vào việc xác định tập hợp các biến dị di truyền ảnh hưởng. Trong những năm gần đây, đã có nhiều cố gắng đưa tính toán PRS ứng dụng vào lâm sàng, tuy nhiên việc lựa chọn các biến dị di truyền ảnh hưởng đến bệnh có độ chính xác chưa cao dẫn đến hiệu quả mô hình chưa đạt kỳ vọng. Trong nghiên cứu này, chúng tôi đã thực nghiệm các mô hình khác nhau để chọn ra tập hợp các biến dị cho giá trị dự đoán tốt nhất. Dữ liệu được sử dụng là dữ liệu trong các nghiên cứu tương quan toàn hệ gen (Genome-Wide Association Studies, GWAS) về rối loạn phổ tự kỷ (Autism Spectrum Disorder, ASD). Tập hợp các biến dị ban đầu được thu gọn bằng phương pháp nhóm và đặt ngưỡng (Clumping and Thresholding, «C + T»), hồi quy logistic phạt (Penalized Logistic Regression, PLR), và loại bỏ đặc trưng đệ quy dựa trên máy vec-tơ tựa (Support Vector Machine Recursive Feature Selection, SVM-RFE). Kết quả cho thấy phương pháp SVM-RFE đưa ra được một tập SNPs mà mô hình dự đoán đạt hiệu năng tốt nhất.
#Bệnh đa di truyền #điểm nguy cơ đa di truyền #GWAS #SNPs #mảng SNP #học máy #bệnh tự kỷ
Tiềm năng thu nhận từ vựng ngẫu nhiên từ việc nghe các bài giảng học thuật về khoa học máy tính: một nghiên cứu điển hình dựa trên tập hợp dữ liệu giáo dục đại học từ Ma Cao. Dịch bởi AI Frontiers in Psychology - Tập 14 - Trang 1219159 - 2023
Các trường đại học ở các quốc gia không nói tiếng Anh ngày càng áp dụng các bài giảng bằng tiếng Anh như phương tiện giảng dạy (EMI). Dường như có một giả định rằng hiệu suất của sinh viên trong các kỳ thi tiếng Anh tiêu chuẩn có thể được coi là tương đương với kiến thức từ vựng cần thiết để hiểu các bài giảng EMI bất kể lĩnh vực chuyên môn. Đối với những từ không quen thuộc mà sinh viên gặp phải, người ta giả định rằng chúng có thể được thu nhận qua việc nghe các bài giảng này. Tiềm năng cho sinh viên thu nhận những từ không quen thuộc một cách ngẫu nhiên trong khi nghe các bài giảng này vẫn chưa được khám phá đầy đủ.
#EMI #case study #computer science #corpora #incidental vocabulary acquisition #lectures
Các phương pháp học máy dựa trên dữ liệu để dự đoán khả năng thấm và nguy cơ ăn mòn trong bê tông lai kết hợp xỉ lò cao và tro bay Dịch bởi AI Asian Journal of Civil Engineering - - Trang 1-13 - 2024
Nghiên cứu này nhằm xác định mô hình học máy phù hợp nhất để dự đoán khả năng thấm và chỉ số điện thế nửa cell của bê tông lai chứa các tỷ lệ khác nhau của xỉ lò cao và tro bay khi tiếp xúc với môi trường giàu chloride. Thiết kế phối trộn tuân thủ các tiêu chuẩn IS 10262:2019, và các mẫu beam bê tông lai, có thanh gia cố lồi, được chế tạo với kích thước 150 × 150 × 700 mm. Tiếp theo, các mẫu này đã trải qua quá trình bảo dưỡng 28 ngày trong nước có nồng độ NaCl 3,5%, mô phỏng sự tiếp xúc với chloride có thể gây ăn mòn bằng cách xâm nhập vào bê tông hướng đến các thanh thép được chôn vào. Khả năng thấm và cường độ nén của bê tông lai được đánh giá bằng cách đúc 36 khối hình lập phương kích thước 150 mm sau 28 ngày bảo dưỡng. Các thử nghiệm điện thế nửa cell được thực hiện trên các mẫu beam bê tông lai đã được tiếp xúc với môi trường chloride để tạo ra tập dữ liệu sử dụng cho mô hình học máy nhằm dự đoán khả năng thấm trong bê tông. Các giá trị khả năng thấm đã được dự đoán và so sánh bằng 3 mô hình học máy, tức là Adaboost, random forest, và XGBoost. Đặc biệt, AdaBoost đã thể hiện độ chính xác đáng kể, cho thấy các mối tương quan mạnh mẽ giữa các giá trị thực tế và giá trị dự đoán. Các phát hiện của nghiên cứu này tương quan và đơn giản hóa quá trình phát hiện ăn mòn trong bê tông, cuối cùng hỗ trợ trong việc phát triển các hệ thống giám sát ăn mòn chính xác và mạnh mẽ hơn.
#học máy #khả năng thấm #bê tông lai #xỉ lò cao #tro bay #ăn mòn #giám sát
Nâng cao Quyết định của Con người với các Trợ giúp Quyết định Tạo ra Bằng AI Dịch bởi AI Computational Brain & Behavior - Tập 5 - Trang 467-490 - 2022
Quyết định của con người thường gặp phải nhiều sai lầm hệ thống. Nhiều trong số các sai lầm này có thể tránh được bằng cách cung cấp các trợ giúp quyết định hướng dẫn người ra quyết định chú ý đến thông tin quan trọng và tích hợp nó theo một chiến lược quyết định hợp lý. Thiết kế các trợ giúp quyết định như vậy trước đây là một quá trình thủ công tốn thời gian. Các tiến bộ trong khoa học nhận thức có thể giúp tự động hóa quy trình này trong tương lai. Chúng tôi gần đây đã giới thiệu các phương pháp học máy để phát hiện các chiến lược tối ưu cho quy trình ra quyết định của con người một cách tự động và một phương pháp tự động để giải thích các chiến lược đó cho mọi người. Các trợ giúp quyết định được xây dựng bằng phương pháp này đã có khả năng cải thiện quy trình ra quyết định của con người. Tuy nhiên, việc theo dõi các mô tả được tạo ra bởi phương pháp này rất tốn công sức. Chúng tôi giả thuyết rằng vấn đề này có thể được khắc phục bằng cách truyền đạt chiến lược quyết định được phát hiện tự động dưới dạng một loạt các hướng dẫn bằng ngôn ngữ tự nhiên về cách thức đưa ra quyết định. Thí nghiệm 1 đã chỉ ra rằng mọi người thực sự hiểu các hướng dẫn quy trình như vậy dễ dàng hơn so với các trợ giúp quyết định được tạo ra bởi phương pháp trước đó của chúng tôi. Khuyến khích bởi phát hiện này, chúng tôi đã phát triển một thuật toán để dịch đầu ra của phương pháp trước đó của chúng tôi thành các hướng dẫn quy trình. Chúng tôi đã áp dụng phương pháp cải tiến để tự động tạo ra các trợ giúp quyết định cho một nhiệm vụ lập kế hoạch tự nhiên (tức là, lập kế hoạch cho một chuyến đi đường) và một nhiệm vụ quyết định tự nhiên (tức là, chọn một khoản thế chấp). Thí nghiệm 2 cho thấy rằng các trợ giúp quyết định được tạo ra tự động này đã cải thiện đáng kể hiệu suất của mọi người trong việc lập kế hoạch cho một chuyến đi đường và chọn một khoản thế chấp. Những phát hiện này gợi ý rằng việc tăng cường dựa trên AI có thể có tiềm năng để cải thiện quy trình ra quyết định của con người trong thế giới thực.
#quyết định con người #các lỗi hệ thống #trợ giúp quyết định #học máy #tự động hóa #hướng dẫn quy trình #lập kế hoạch #thế chấp
Cải thiện phân loại email thông qua phương pháp tiền xử lý dữ liệu nâng cao Dịch bởi AI Spatial Information Research - Tập 29 - Trang 247-255 - 2021
Email đã trở thành một trong những hình thức giao tiếp được sử dụng rộng rãi nhất, dẫn đến sự gia tăng theo cấp số nhân trong số lượng email nhận được và tạo ra một gánh nặng khổng lồ cho các phương pháp phân loại email hiện có. Việc áp dụng phương pháp phân loại trên dữ liệu thô có thể làm giảm hiệu suất của các thuật toán phân loại. Do đó, dữ liệu cần được chuẩn bị để nâng cao hiệu suất của các bộ phân loại học máy. Bài báo này đề xuất một phương pháp tiền xử lý dữ liệu nâng cao cho phân loại email đa danh mục. Mô hình đề xuất sẽ loại bỏ chữ ký trong email. Hơn nữa, các ký tự đặc biệt và từ ngữ không mong muốn sẽ được loại bỏ bằng các phương pháp tiền xử lý khác nhau như loại bỏ từ dừng, loại bỏ từ dừng nâng cao và stemming. Mô hình đề xuất được đánh giá bằng cách sử dụng nhiều bộ phân loại như Multi-Nominal Naïve Bayes, Bộ Phân loại Vector Hỗ trợ Tuyến tính, Hồi quy Logistic và Rừng ngẫu nhiên. Các kết quả cho thấy phương pháp tiền xử lý dữ liệu được đề xuất cho phân loại email vượt trội hơn so với phương pháp hiện có.
#phân loại email #tiền xử lý dữ liệu #học máy #Multi-Nominal Naïve Bayes #Rừng ngẫu nhiên
BÀI HỌC TỪ SỰ CỐ HƯ HỎNG MÁY CẮT 500kV VÀ GIẢI PHÁP NÂNG CAO TUỔI THỌ MÁY CẮT ĐIỆN CHO KHÁNG ĐIỆN BÙ NGANG Việc nghiên cứu ứng dụng thiết bị điều khiển đóng/mở đã được các công ty điện lực rất quan tâm nhằm giảm thiểu ảnh hưởng của quá trình quá độ khi đóng/mở các tải phản kháng. Máy cắt điện 500kV là một thiết bị quan trọng và đắt tiền trong trạm biến áp. Khi mở máy cắt đối với các kháng điện bù ngang cần được nghiên cứu, tính toán cẩn thận vì điều khiển mở máy cắt không chính xác có thể dẫn đến hiện tượng đánh lửa trở lại, thậm chí có thể gây hư hỏng máy cắt. Bài báo tiến hành phân tích sự cố hư hỏng máy cắt điện 500kV khi mở kháng điện tại trạm biến áp 500kV Hiệp Hòa, đồng thời đề xuất các giải pháp giảm hư hỏng máy cắt khi mở kháng điện trong tương lai.
#Circuit breaker #Controlled Switching Device #Re-ignition #Shunt reactor #SynchroTeq.
Hệ thống Xe Điện Thông Minh cho Các Thành Phố Thông Minh: Ứng Dụng Học Sâu trong Hệ Thống Hỗ Trợ Lái Xe Nâng Cao Dịch bởi AI International Journal of Intelligent Transportation Systems Research - Tập 20 - Trang 745-758 - 2022
Công nghệ trí tuệ nhân tạo và các phương pháp học sâu chắc chắn là tương lai của các hệ thống hỗ trợ lái xe nâng cao (ADAS). Bài báo này trình bày một kỹ thuật để phát hiện, nhận diện và theo dõi người đi bộ, phương tiện và xe đạp dọc theo hạ tầng đường ray xe điện trong môi trường đô thị phức tạp bằng cách sử dụng Các phương pháp Thị giác Máy tính, Học sâu và thuật toán YOLOv3. Các thí nghiệm đã được tiến hành trên tuyến xe điện Line 2 "Borgonuovo – Notarbartolo" (Palermo, Ý) tại các đoạn đường ray giao nhau với một vòng xuyến có đường kính ngoài là 24 m. Một xe khảo sát được trang bị camera video đã được sử dụng trong nghiên cứu. Kết quả nghiên cứu cho thấy phương pháp được đề xuất có khả năng tìm kiếm và phát hiện vị trí cũng như tốc độ của người tham gia giao thông gần và trên đường ray trước xe điện một cách rất chính xác, điều này được thể hiện qua các giá trị ước lượng về Độ chính xác, Mất mát và Độ chính xác thu được trong quá trình đào tạo mạng nơ-ron. Việc triển khai phương pháp phát hiện tiên tiến này trong các hệ thống ADAS có thể tăng cường an toàn cho các xe điện tự động mới và các xe điện nhanh tự động (ARTs).
#trí tuệ nhân tạo #học sâu #hệ thống hỗ trợ lái xe #ADAS #xe điện #thị giác máy tính
ÁP DỤNG HỌC MÁY ĐỂ NÂNG CAO ĐỘ CHÍNH XÁC CHO DỰ ĐOÁN NGUY CƠ ĐA DI TRUYỀN VỚI DỮ LIỆU RỐI LOẠN PHỔ TỰ KỶĐiểm nguy cơ đa di truyền (polygenic risk scores, PRS) là một giá trị ước lượng tương đối nguy cơ mắc bệnh dựa vào việc xác định tập hợp các biến dị di truyền ảnh hưởng. Trong những năm gần đây, đã có nhiều cố gắng đưa tính toán PRS ứng dụng vào lâm sàng, tuy nhiên việc lựa chọn các biến dị di truyền ảnh hưởng đến bệnh có độ chính xác chưa cao dẫn đến hiệu quả mô hình chưa đạt kỳ vọng. Trong nghiên cứu này, chúng tôi đã thực nghiệm các mô hình khác nhau để chọn ra tập hợp các biến dị cho giá trị dự đoán tốt nhất. Dữ liệu được sử dụng là dữ liệu trong các nghiên cứu tương quan toàn hệ gen (Genome-Wide Association Studies, GWAS) về rối loạn phổ tự kỷ (Autism Spectrum Disorder, ASD). Tập hợp các biến dị ban đầu được thu gọn bằng phương pháp nhóm và đặt ngưỡng (Clumping and Thresholding, «C + T»), hồi quy logistic phạt (Penalized Logistic Regression, PLR), và loại bỏ đặc trưng đệ quy dựa trên máy vec-tơ tựa (Support Vector Machine Recursive Feature Selection, SVM-RFE). Kết quả cho thấy phương pháp SVM-RFE đưa ra được một tập SNPs mà mô hình dự đoán đạt hiệu năng tốt nhất.
#Bệnh đa di truyền #điểm nguy cơ đa di truyền #GWAS #SNPs #mảng SNP #học máy #bệnh tự kỷ